National Repository of Grey Literature 6 records found  Search took 0.01 seconds. 
Bioinformatics Tool for Prediction of Protein Solubility
Čermák, Jiří ; Hon, Jiří (referee) ; Martínek, Tomáš (advisor)
To achieve cheaper and more efficient protein production, we must be able to predict protein solubility. In this thesis, we describe creation of bioinformatic data sets based on Target Track and eSol databases, we test the features used in existing protein solubility prediction tools and create a new predictor. Even though we fail to create an effective prediction tool we find out that in most cases the old features tested on the new data do not correlate with protein solubility as strongly as others repot in older and smaller datasets.
Prediction of the Effect of Mutation on Protein Solubility
Velecký, Jan ; Martínek, Tomáš (referee) ; Hon, Jiří (advisor)
The goal of the thesis is to create a predictor of the effect of a mutation on protein solubility given its initial 3D structure. Protein solubility prediction is a bioinformatics problem which is still considered unsolved. Especially a prediction using a 3D structure has not gained much attention yet. A relevant knowledge about proteins, protein solubility and existing predictors is included in the text. The principle of the designed predictor is inspired by the Surface Patches article and therefore it also aims to validate the results achieved by its authors. The designed tool uses changes of positive regions of the electric potential above the protein's surface to make a prediction. The tool has been successfully implemented and series of computationally expensive experiments have been performed. It was shown that the electric potential, hence the predictor itself too, can be successfully used just for a limited set of proteins. On top of that, the method used in the article correlates with a much simpler variable - the protein's net charge.
Protein solubility prediction using CNN and CNN-LSTM hybrid models
SYSOYKOVA, Ekaterina
Protein solubility prediction based on the raw amino acid sequence using three machine/deep learning techniques: RF, CNN, and a hybrid CNN-biLSTM model. Assessment of the performance difference between the models with evaluation metrics and statistical significance tests.
Mining of soluble enzymes from genomic databases
Hon, Jiří ; Brejová, Bronislava (referee) ; Šafránek, David (referee) ; Zendulka, Jaroslav (advisor)
Enzymy jsou proteiny urychlující chemické reakce s velkým potenciálem pro farmaceutický a obecně chemický průmysl. Enzymatická funkce je obvykle zajištěna několika nepostradatelnými aminokyselinami, které tvoří tzv. aktivní místo, kde se odehrává chemická reakce. V této práci jsou prezentovány dva integrované softwarové nástroje pro dolování a racionální výběr nových rozpustných enzymů - EnzymeMiner a SoluProt.  EnzymeMiner slouží k hledání nových enzymů. Na vstupu vyžaduje jednu nebo více sekvencí zvoleného enzymu spolu se seznamem klíčových aminokyselin. Tento seznam slouží k zvýšení pravděpodobnosti, že nalezený enzym bude mít podobnou funkci jako vstupní enzym. Výstupem EnzymeMineru je množina anotovaných sekvencí nalezených v databázi. Za účelem ulehčení výběru několika málo kandidátů pro experimentální ověření v laboratoři integruje EnzymeMiner anotace z dostupných databází - informaci o zdrojovém organismu a prostředí, ve kterém se vyskytuje, a informaci o proteinových doménách, ze kterých se enzym skládá. Hlavním kritériem pro výběr kandidátů je rozpustnost predikovaná druhým prezentovaným nástrojem, SoluProtem. SoluProt je metoda založená na strojovém učení, která predikuje heterologní rozpustnou expresi proteinu v organismu Escherichia coli . Vstupem je sekvence a výstupem je pravděpodobnost, že protein bude exprimován v rozpustné formě. SoluProt využívá model gradient boosting machine a byl trénován na datové sadě odvozené od databáze TargetTrack. Při srovnání na vyvážené nezávislé datové sadě odvozené z databáze NESG dosáhl SoluProt přesnosti 58,5 % a hodnoty AUC 0,62, čímž lehce převyšuje ostatní existující nástroje. Nástroje EnzymeMiner i SoluProt jsou často využívány řadou uživatelů z oblasti proteinového inženýrství za účelem hledání nových rozpustných biokatalyzátorů chemických reakcí. Ty mají velký potenciál snížit energetickou náročnost a ekologickou zátěž mnoha průmyslových procesů.
Prediction of the Effect of Mutation on Protein Solubility
Velecký, Jan ; Martínek, Tomáš (referee) ; Hon, Jiří (advisor)
The goal of the thesis is to create a predictor of the effect of a mutation on protein solubility given its initial 3D structure. Protein solubility prediction is a bioinformatics problem which is still considered unsolved. Especially a prediction using a 3D structure has not gained much attention yet. A relevant knowledge about proteins, protein solubility and existing predictors is included in the text. The principle of the designed predictor is inspired by the Surface Patches article and therefore it also aims to validate the results achieved by its authors. The designed tool uses changes of positive regions of the electric potential above the protein's surface to make a prediction. The tool has been successfully implemented and series of computationally expensive experiments have been performed. It was shown that the electric potential, hence the predictor itself too, can be successfully used just for a limited set of proteins. On top of that, the method used in the article correlates with a much simpler variable - the protein's net charge.
Bioinformatics Tool for Prediction of Protein Solubility
Čermák, Jiří ; Hon, Jiří (referee) ; Martínek, Tomáš (advisor)
To achieve cheaper and more efficient protein production, we must be able to predict protein solubility. In this thesis, we describe creation of bioinformatic data sets based on Target Track and eSol databases, we test the features used in existing protein solubility prediction tools and create a new predictor. Even though we fail to create an effective prediction tool we find out that in most cases the old features tested on the new data do not correlate with protein solubility as strongly as others repot in older and smaller datasets.

Interested in being notified about new results for this query?
Subscribe to the RSS feed.